En el presente trabajo se abarcarán algunas de las funciones más básicas de R. La aplicación de las funciones está delimitada por los datos que se analizarán. Es por esto que la selección de los datos tendrá como objetivo posibilitar el uso de la mayor cantidad de funciones, prioritariamente “webscraping”, representación de información geográfica y la obtención de información por medio de APIS.
A continuación se estudiarán las expresiones regulares de las siguientes páginas:
En este sitio web se explica de forma muy sencilla qué es una expresión regular. En resumen diferencia las expresiones regulares de las cadenas de caracteres exactas en que, la expresion regular utiliza tanto caracteres literales como metacaracteres para realizar una búsqueda de patrones de texto. El carácter literal coincide con la ocurrencia del caracter, mientras que el metacarácter va servir de delimitador de la búsqueda.
Para concluir el autor hace una tabla de algunas expresiones regulares, que en mi criterio es muy básica.
En esta página no se brinda una definición de lo que son las expresiones regulares, sin embargo, realiza una lista de funciones de R que se ejecutan utilizando expresiones regulares. El autor expone algunas funciones de manipulación de texto de R que utilizan expresiones regulares, como por ejemplo:
+ Paste
+ Strsplit
+ Chartr
+ Gsub
Además, incluye otras funciones de búsqueda, tales como:
+ Grep
+ Regexpr
El autor finaliza con una tabla muy completa en la que en tres columnas expone la sintaxis de la expresión, hace una descripción de la expresión regular y brinda un ejemplo (si aplica). Abarca expresiones regulares compredidos únicamente por metacaracteres (^, |, •, $), y otras muy comunes comprendidas por caracteres literales y metacaracteres (a+, a{2,4}?, [A-Z]…).
En este apartado sobre markdown es conveniente mencionar que existe mucha información en la web acerca del uso de markdown y los textos se encuentran tanto en inglés como en español, por lo que ante una duda existen muchas fuentes de consulta, sin embargo, la información suele ser para un usuario principiante.
En el sitio web previamente mencionado el autor explica de una forma muy sencilla qué es, para qué se utiliza y las razones por las cuales se debe utilizar markdown. Luego, se estudia la sintaxis donde explica los elementos básicos de este lenguaje, los ejemplifica y da una vista previa del resultado en markdown. Además, menciona los que en su criterio, son los mejores editores de markdown y brinda una descripción básica de cada uno. Por último, decribe Multimarkdown como la alternativa cuando se requieren más funciones y mencionas cuatro funciones de esta herramienta.
Esta fue la página web más completa de markdown que encontré. El autor abarca aspectos que van desde qué es markdown, por qué se recomienda usarlo, cómo tranforma los textos, hasta su uso para escribir un libro eléctronico, presentación o correos electrónicos.
Además, incluye la sintaxis básica y extendida de esta herramienta, menciona una lista de aplicaciones y componentes que soportan markdown, y sugiere un libro de consulta Markdown Guide Book.
Para finalizar, la web contiene muchos enlaces donde se obtiene un manual de uso de las aplicaciones con las que markdown es compatible.
A continuación se presentarán los datos de criminalidad de Inglaterra y Wales por el mes de setiembre.
| constituency | country | population | land_area | asb | burglary | robbery | vehicle | violent | shoplifting | cda | other_theft | drugs | bike_theft | theft_from_person | weapons | order | other | total |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Cities of London and Westminster | England | 122923 | 1639.86 | 1017 | 333 | 324 | 242 | 875 | 398 | 217 | 1809 | 250 | 142 | 1294 | 33 | 233 | 57 | 7224 |
| Leeds Central | England | 152847 | 3600.60 | 457 | 207 | 64 | 238 | 1056 | 278 | 284 | 329 | 102 | 66 | 123 | 40 | 302 | 73 | 3619 |
| Holborn and St Pancras | England | 154210 | 1319.75 | 681 | 204 | 147 | 166 | 455 | 97 | 78 | 724 | 127 | 116 | 487 | 14 | 135 | 16 | 3447 |
| Birmingham, Ladywood | England | 146279 | 2585.38 | 355 | 148 | 176 | 224 | 903 | 176 | 162 | 266 | 80 | 23 | 94 | 32 | 182 | 27 | 2848 |
| Liverpool, Riverside | England | 131888 | 2450.43 | 402 | 88 | 43 | 123 | 603 | 157 | 137 | 205 | 295 | 83 | 132 | 22 | 180 | 17 | 2487 |
| Bermondsey and Old Southwark | England | 144175 | 1042.17 | 478 | 111 | 159 | 111 | 384 | 50 | 83 | 431 | 126 | 66 | 325 | 11 | 103 | 9 | 2447 |
| Newcastle upon Tyne Central | England | 102253 | 2323.15 | 684 | 54 | 12 | 69 | 552 | 182 | 193 | 205 | 95 | 43 | 85 | 30 | 190 | 31 | 2425 |
| Middlesbrough | England | 95892 | 2912.74 | 656 | 128 | 26 | 129 | 607 | 161 | 244 | 135 | 66 | 18 | 16 | 11 | 150 | 52 | 2399 |
| Bethnal Green and Bow | England | 146820 | 916.28 | 707 | 190 | 84 | 168 | 368 | 44 | 88 | 244 | 111 | 86 | 95 | 7 | 108 | 14 | 2314 |
| West Ham | England | 185200 | 1734.72 | 419 | 113 | 98 | 179 | 509 | 149 | 120 | 236 | 175 | 34 | 142 | 16 | 90 | 20 | 2300 |
| Bristol West | England | 138885 | 1724.69 | 567 | 84 | 44 | 164 | 493 | 151 | 119 | 181 | 36 | 99 | 45 | 7 | 238 | 14 | 2242 |
| Sheffield Central | England | 130085 | 2135.64 | 381 | 160 | 55 | 169 | 420 | 150 | 121 | 182 | 44 | 39 | 84 | 19 | 194 | 45 | 2063 |
| Tottenham | England | 142569 | 1313.52 | 435 | 112 | 188 | 251 | 459 | 55 | 85 | 147 | 84 | 19 | 96 | 19 | 79 | 19 | 2048 |
| Derby South | England | 115414 | 3121.97 | 454 | 85 | 32 | 82 | 677 | 95 | 157 | 118 | 60 | 35 | 34 | 18 | 157 | 40 | 2044 |
| Nottingham South | England | 118722 | 3256.79 | 589 | 135 | 27 | 67 | 384 | 160 | 130 | 138 | 151 | 58 | 54 | 19 | 91 | 32 | 2035 |
| Bradford West | England | 117969 | 3606.89 | 310 | 70 | 27 | 84 | 784 | 92 | 143 | 128 | 52 | 7 | 36 | 9 | 221 | 55 | 2018 |
| Hackney South and Shoreditch | England | 134550 | 998.92 | 362 | 141 | 93 | 135 | 356 | 61 | 82 | 197 | 71 | 94 | 248 | 12 | 91 | 14 | 1957 |
| Nottingham East | England | 109797 | 1870.27 | 475 | 78 | 29 | 86 | 451 | 138 | 116 | 148 | 101 | 23 | 67 | 24 | 116 | 53 | 1905 |
| Islington South and Finsbury | England | 118926 | 748.68 | 351 | 115 | 66 | 154 | 290 | 85 | 79 | 259 | 80 | 77 | 252 | 6 | 65 | 18 | 1897 |
| Vauxhall | England | 122334 | 856.99 | 419 | 115 | 68 | 116 | 360 | 57 | 49 | 317 | 72 | 44 | 136 | 21 | 71 | 9 | 1854 |
De la tabla anterior vamos a comprobar si la siguiente hipótesis es verdaddera:“Existe alguna relacion entre la cantidad de habitantes y el total de crímenes”. Es decir, ¿La cantidad de crímenes de una ciudad es proporcional a la cantidad de habitantes que lo habitan? Si esto es cierto, las ciudades con un mayor número de habitates deberían presentar un mayor número de crímenes, lo contrario, se vería reflejado en las ciudades con menos habitantes.
Para ello, vamos a filtar las tres ciudades con menor y mayor cantidad de habitantes y estudiar la relación Cantidad de población-Crímenes por medio de una gráfica.
| constituency | country | population | land_area | asb | burglary | robbery | vehicle | violent | shoplifting | cda | other_theft | drugs | bike_theft | theft_from_person | weapons | order | other | total | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10 | West Ham | England | 185200 | 1734.72 | 419 | 113 | 98 | 179 | 509 | 149 | 120 | 236 | 175 | 34 | 142 | 16 | 90 | 20 | 2300 |
| 26 | Poplar and Limehouse | England | 161144 | 1060.62 | 557 | 92 | 52 | 191 | 339 | 43 | 83 | 146 | 59 | 28 | 48 | 10 | 83 | 8 | 1739 |
| 34 | Blackpool South | England | 79725 | 2022.67 | 514 | 63 | 11 | 78 | 401 | 100 | 116 | 154 | 29 | 15 | 25 | 10 | 70 | 15 | 1601 |
| 60 | East Ham | England | 162796 | 1887.64 | 273 | 91 | 48 | 120 | 328 | 58 | 79 | 102 | 147 | 9 | 61 | 7 | 86 | 30 | 1439 |
| 61 | Kingston upon Hull West and Hessle | England | 86690 | 2373.29 | 223 | 107 | 18 | 74 | 404 | 127 | 133 | 90 | 37 | 46 | 8 | 7 | 134 | 26 | 1434 |
| 74 | Redcar | England | 87215 | 7245.45 | 502 | 50 | 7 | 55 | 299 | 124 | 159 | 63 | 12 | 6 | 5 | 5 | 69 | 35 | 1391 |
Como podemos observar en la gráfica, la tendencia sí es que a un mayor nivel de población se dé una mayor tasa de criminalidad, sin embargo, esta no es la regla. Las tres ciudades con menor cantidad de población presentan una menor cantidad de crímenes y lo contrario sucede con las ciudades de West Ham y Poplar and Limehouse. Pero cuando nos detenemos a observar East Ham, se infiere que a pesar de la gran cantidad de población presenta una cantidad baja de crímenes. La causa de esto se puede explicar a que la cantidad de población no es el único factor que incide en la cantidad de crímenes, tales como: Ingresos de los habitantes de la ciudad, nivel de estudios, entre otros.
A continuación vamos a estudiar el total de registros de cada crimen:
| variable | total | |
|---|---|---|
| 12 | weapons | 1262 |
| 14 | other | 2481 |
| 10 | bike_theft | 3298 |
| 3 | robbery | 3808 |
| 9 | drugs | 5754 |
| 11 | theft_from_person | 5970 |
| 2 | burglary | 9145 |
| 6 | shoplifting | 9477 |
| 13 | order | 10802 |
| 7 | cda | 12012 |
| 4 | vehicle | 12023 |
| 8 | other_theft | 15070 |
| 1 | asb | 34355 |
| 5 | violent | 43093 |
| 15 | total | 168550 |
De la tabla anterior se concluye que los 5 crímenes con más registros son: violent, asb, other theft, order, vehicle.
A continuación vamos a localizar en el mapa la ciudad con mayor cantidad de registros de criminalidad: West Ham
Por medio de la API de la policia del Reino Unido se pueden recuperar los crímenes registrados en un radio de una milla de un punto seleccionado. En la siguiente tabla se muestran los crímenes registrados como violent-crime en West Ham.
| category | location_type | month | |
|---|---|---|---|
| 25 | violent-crime | Force | 2019-10 |
Como podemos ver del crímen violent_crime tiene 134 registros dentro de un rango de una milla del punto latitud= 51.5 y longitud= 0.0125
Al realizar este trabajo fui testigo de la difícil tarea de segmentar las grandes cantidades de información que se obtienen de internet, tanto de datos de algún tema en específico como de los recursos de markdown. La escogencia de la información se basó en su utilidad para el uso de APIS, webscraping y mapas de google, cuyo uso, fue uno de los objetivos principales de este trabajo y no el análisis de los mismos.
Para concluir, con este proyecto se hizo un repaso de algunas funciones básicas de R y markdown. Lejos de ser una presentación de las funciones principales, la ejecución de este proyecto sirvió para investigar la gran canbtidad de funciones que permiten ambas herramientas.